查看原文
其他

WeChat ID freesvc Intro Free Service, Free Style, Free Startup, Free Spirit.                                            英国科幻小说作家亚瑟·克拉克曾指出,任何科技如若足够先进,就和魔法别无二致。 《经济学人》今年 1 月发表的封面文章《轻而易 “语” 》回应了亚瑟的观点,作者以迅速发展的语音识别技术举例:对着空气说一句话,附近的智能设备就会帮你得偿所愿。 这种变化非同小可。机器诞生之初,仅能对纵列数字做简单的加法运算,而现在却可下出一盘好棋、理解简单对话并执行指令。 在语音识别与大数据的宝藏中,我们还可以挖掘什么? 第 2 期「 X 实验室」,峰瑞资本(FreeS Fund)将与中国人工智能学会一道,走进科大讯飞大数据研究院。他们从 2003 年起即启动语音识别项目,至今识别准确率已达到 97%,而期间积累下来的大数据,则为精准营销、个性化学习、智慧城市等领域的研究打下基础。 本期值班研究员谭昶将于 5 月 12-14 日在由中国人工智能学会主办的《大数据:从理论到应用》讲习班分享更多内容,点击文末「阅读原文」 即可报名。                                            「 X 实验室」第 2 期 值班研究员 我是 2015 年加入科大讯飞的,此前曾经创办了一个大数据创业公司,为中国移动等企业做了一些大数据项目。随着业务的开展,我和创业小伙伴们发现做好大数据技术的前提条件是能够接触到真正意义上的大数据,否则就像是一直围绕着大数据这座金山周围的小土丘打转,挖不到真正的金子。恰好这时,讯飞邀请我加入,组建讯飞大数据研究院,从讯飞人工智能开放平台 8.9 亿用户这座金山里挖掘数据价值。 讯飞核心研发部门包括讯飞研究院、云平台研发部、大数据研究院、语音资源部。这几个部门加起来共有 500 人左右,不到讯飞的员工总数 6000 人的十分之一,但是这些部门产出了讯飞几乎所有的科研成果。 通常,核心研发部门相对较为关注如何把技术做到极致,而业务部门则更注重思考技术的落地和应用。我们的工作不仅局限于研发顶尖技术,还包括业务系统研发过程中的技术咨询、方案设计等很接地气的工作。有时为了核心技术的落地应用,我们也会和业务部门一起走到前线,和最终用户沟通需求。同时,核心研发部门也是公司内部资源共享的重要平台,例如公司会把所有部门的数据处理分析任务都放到研发部门的大数据平台 Odeon 上来,整个公司的业务数据都是打通和共享的。 今天,我们重点关注以下几个问题: 语音识别准确率达到 97% 之后,我们计划做什么? 大数据变现的关键要素是什么? 语音识别的下一步 回答这个问题前,我们可以先回顾一下讯飞是怎么一步一步把核心技术做到世界领先的。 2003 年时,讯飞下定决心,要做中国的原创核心技术企业。那时,大家都认为语音识别不可能赚钱,有谁会对着机器说话呢?正是市场的这种认知,逼着我们尝试把语音技术应用到各个领域去,在各个领域都扎下了一些业务的苗子。例如,我们通过声纹识别和人脸识别的结合来搭建社会保障生存认证系统,又通过语音识别和转写来做讯飞输入法,还做了口语考试的语音评测体系等等。 我们在技术层面取得的突破,得益于 2006 年开始,深度学习技术的迅速发展。在 2008 年至 2010 年间,讯飞最早把这项技术运用到了语音识别领域。 2010 年后,我们又把单纯的语音识别扩展到自然语音理解,并尝试了人机交互、图像识别方面的工作。现在,讯飞的语音识别准确率已经可以达到 97%,并且能够实现实时语音转写和翻译。 回顾过去,我们最初的愿景其实是让机器能听会说,而能听会说的下一步则是理解自然语言。这个标准实际上已经非常接近于要求机器能理解、会思考。语言是人类区别于其他动物的最大特征,到了以 「能理解、会思考」 为目标的阶段,讯飞也自然而然地从语音技术公司转变成了人工智能公司。 不过,虽然我们的核心技术已经应用到了各个领域,我们仍始终认为,让技术转化为实际生产力是一个非常漫长的过程。即便技术登峰造极,产品如果不接地气,市场仍然不会去买单。在我们的办公园区里,有一座名为 「顶天立地」 的雕塑,寓意就是提醒讯飞人:技术要顶天,应用要落地。因此,我们认为,即使技术走到了 90% 或 99% 那一步,如果还没有得到市场的认可,我们也只是刚刚起步。 大数据的变现通路 讯飞基于自有大数据或者合作伙伴的大数据,重点在精准营销、个性化学习、智慧城市三个方向做了应用落地和技术研发。 ▌ 精准营销 在精准营销领域,讯飞最大的优势是有自己独一无二的大数据来源。讯飞的人工智能开放平台向所有有兴趣做人工智能应用的合作伙伴开放人工智能能力,同时通过这些合作伙伴手机到了大量的用户行为数据。讯飞现在有 20 万家合作伙伴,领域从手机输入法、手机语音助手,到导航 App 里林志玲、郭德纲的语音,还有购物 App 里的语音搜索,讯飞已经构建起一个人工智能和语音服务的生态圈。 例如,目前市面上能够买到的和人对话的机器人、儿童玩具或手机 App,80% 以上都使用了讯飞的人工智能云服务。目前平台上有 8.9 亿独立用户,包括讯飞输入法的 3.6 亿用户,每天产生 30 亿次交互。因此讯飞也建设了大数据能力平台 Odeon ,用来存储、处理这些大数据。Odeon 自 2010 年上线以来,目前集群已有 400 余台,日均新增数据达到 100TB。这是讯飞自有大数据宝藏的最主要源泉。 以平台上的大数据为基础,我们综合运用人工智能和大数据技术,从人生阶段、行业、购物偏好、媒介偏好等维度,用 1700 个子标签对这些用户作出区分。例如,声纹识别技术对用户的性别划分、年龄划分很有帮助,如果仅靠传统的用户行为数据或日志数据,我们是没有办法得到这些精准结论的。 用户画像完成后,第一件可以做的事情就是精准营销。精准营销的核心价值在于对用户的分析、挖掘以及引导,而导流的最终体现则是用户对广告的点击。这已是一条比较成熟的数据变现路径。 在广告形式上,讯飞也做了一些创新探索。例如交互式广告,用户对着手机喊出相应的品牌,即可赢得一些奖励。现在,我们不仅对内部的讯飞广告平台提供服务,也对有精准营销需求的第三方提供数据交换和查询服务。这项业务每年可以做到数亿流水。 另一部分精准营销的工作内容围绕推荐付费内容展开,包括推荐付费音乐、铃声、阅读和一些视频内容。根据个性化推荐算法,我们把不同的付费内容匹配给不同用户,再进行一些商业化运作。 ▌个性化学习 在教育领域,「因材施教」 的道理听上去很简单,但背后需要非常复杂的脑力劳动来支撑。老师需要知道学生擅长什么,什么相对而言比较薄弱,了解程度需要具体到知识点层面,比如,某位同学擅长一元二次方程,但平面几何稍差一些,题目设置的难度和学生需要投入的精力,在这些知识点间都要有所不同。 通常,老师了解学生学习情况的方式是上课提问,或者看作业错题和考试成绩。如果用机器来完成这一步,就需要让机器也能够 能看会写、能听会说。讯飞目前的做法是用高速扫描仪,把学生日常作业、随堂检测、考试答题卡等全部扫描进去,把题目和答案转化成一个个对知识薄弱点的判断数据,再把这些数据集合起来形成教育大数据,有针对性地向学生推荐相应的课程和题目。 这其中,关键的两个步骤分别是:利用人工智能的手段,搜集真正的教育过程数据;把教育过程数据转化成为学生学习过程中有的放矢的针对性辅导。按照中国目前的经济发展水平,我们不可能要求所有学校学生的学习过程全部上网,所以我们提供了上述解决方案——高速扫描手写作业和试卷。 我们组建了一支数十人的团队来完成这部分工作。项目筹备期比较久,直到 2014、2015 年时,我们才在技术层面取得突破。在评阅英语作文、语文作文这一块,我们曾面临很多问题。例如,在英文作文中出现了汉语拼音怎么办?从文字识别到自动评分,这个过程花费了一些时间才得以完成。这两年学生参加四六级考试,作文部分的阅卷工作很可能就是由讯飞的机器来完成的。我们在 2016 年时做过验证,机器阅卷判定的分数,和专家组的打分结果不相上下。 现在,我们和全国百强校中的一半学校签署了战略合作协议,把个性化学习的核心技术打造成讯飞的智学网产品,供全国各地的学生使用。最初讯飞的个性化学习实验在合肥一中开展。实验结果非常好,一个学期的时间,两个实验班同学的数学平均成绩提高了 10%,从全年级二十多个班级中的第 14、15 名,提升到了第 1、2 名。 与此类似的领域还有医疗大数据。这部分业务,我们还处在探索阶段。医疗是一件非常有趣的事情,就像学生学习依赖于有经验的老师来辅导那样,医疗也依赖于有经验的医生的判断。我们通过数据收集、设计人工智能模型,学习有经验的医生的诊断过程,再把诊断过程变得自动化。我们已经取得了一些成果,例如在肺癌检测方面,以前诊断一个病人,一位医生要花费一天的时间看上几百张 CT 片,现在这个过程机器只需要几分钟就可以给出初步结果供医生决策。 ▌智慧城市 加入讯飞后,我的第一个任务就是做智慧城市大数据分析。想让城市的服务变得智慧化需要调用许多大数据,包括交通数据、运营商数据、政府数据、舆情数据等。如何从这些数据中分析出城市的发展状况以及城市内部存在的问题,是我们的核心任务。 其中,在交通领域最基础的工作是跟踪人和车的移动轨迹,研究他们的移动规律。每座城市都可以划分为若干个区域,区域间的人群流动就像城市的血脉。例如,白天人们从 A 区到 B 区上班,晚上人们从 B 区回 A 区居住休息。 从这些移动轨迹中,我们能够分析出人们在哪里住、在哪里工作、去哪里娱乐,能够发现城市的职住比是否平衡,每片区域更应该打造成为商业区、居住区还是工业区。此外,我们还可以据此判断发生拥堵、踩踏事故的几率,并提前 20-40 分钟进行预警。 在判断轨迹的数据来源方面,我们认为,地图导航等 App 的使用频率还是偏低。相较而言,手机运营商的基站产生的数据量更大。城市里,所有人的手机几乎都时刻连接着运营商的基站,不停上报自己的位置。 不过,运营商基站接收到的信号范围半径在 1000-2000 米左右,没有办法精确到城市规划所需的 100 米的范围内。我们为此设计了核心算法,通过高频采样,把不精确的数据尽可能精确起来。现在精确度基本可以达到 50 米左右。 此外,我们还会在互联网加政府服务领域做了一些数据打通的工作。此前政府的信息化系统基本上相当于一座座数据孤岛,距离数据共享、交换还有一段距离,需要一套政府政务数据流通和交换的生态系统。 这里举一个例子说明我们可以做的事情:在安徽芜湖,我们把原来每个部门一个的政府服务办事窗口从 10 个减少到了 2 个统一受理窗口,工作效率不受影响,反而大大提升。这是因为原来公文流转的速度很慢,而现在可以通过我们的政务数据共享交换平台直接交换各部门的数据和审批结果,所有便民便企服务都可以得到及时处理。 「红海」中的新机遇 讯飞作为一家人工智能企业,从 2010 年开始做大数据,对于大数据产业有一些自己的认识。大数据产业可以从四个层面来观察剖析:  一是大数据技术的发展。这里更多是指数据的分析和挖掘技术。在数据统计查询层面,我们已经做到比较成熟的状态,再进一步是数据的理解和搜索,以及对未来态势的预测。层次越往上,做起来越困难,越不太可能用简单的统计分析方法来解决,越会更多地依靠深度学习、机器学习等人工智能相关技术。  二是大数据的生态体系变化。现在,大数据产业内部的分工越来越明确,很多企业都在寻找自己在产业链中的定位,包括讯飞自己。提供数据、提供技术、制定交易策略,还是去做应用,这都是不同的发力方向。讯飞大数据研究院也是讯飞对大数据产业战略思考之后的产物,也就是讯飞要做大数据领域的核心技术研发者。 三是大数据市场的变化。目前,在互联网、市场营销领域,大数据挖掘已成为 「红海」,竞争和技术扩散涉及各个行业。政府、金融、电信等领域也成为大数据应用的重要增长点。而在传统零售、制造、物流等行业,大数据还大有可为,值得在数据采集、处理、存储方面多下功夫。 四是大数据服务形态的变化。这两年,人工智能的概念炒得很热。我是做大数据出身的,面对这种热潮,心态已经比较平和。我相信,如果你去问一个做物联网或者云计算的人,他的心态会比我更平和。技术的发展是有自己的节奏的,作为技术研发人员,还是要跟着自己的节奏走,不能跟随市场热点而波动。 在这片市场中,也有创业公司可以一展身手的机会。这些机会更多在于具体的应用创新。大数据细分市场有很多,包括交通大数据、教育大数据等等,每个领域都是无穷无尽的宝藏。就目前来看,我们其实连宝藏上的第一层浮土都还没挖开。 其实,无论大数据、人工智能还是云计算,都是信息服务业的一个技术组成部分。现在,这三者之间已经产生了紧密的联系。人们越来越难以区分谁是大数据、谁是云计算、谁是人工智能。应该说现有的信息化服务的最终目的都是为了提供能够随时随地获得的智能化服务,并在达到目的的过程中从海量数据中不断自我学习、自我优化这些智能化服务。 这是「X实验室」的第二期。 X 是一个占位符,一个空缺的变量,等待你的想法和创意。峰瑞资本试图传承传统实验室精神。谷歌成立 X 实验室并开展登月计划时,拉里·佩奇曾这样表达初心:“我们非常认真地想让世界变得更美好 。” 如同制造首颗原子弹的 “曼哈顿计划” ,又如同 AT&T 等企业的研发中心。比起短期利益,这里更关注尖端技术及其长期价值。 在这里,峰瑞资本与你一起,大胆想、大胆做。  ▲ 人工智能公司的估值怎么算? ▲ 峰瑞研究报告(七):中国医疗数据创业4大方向 ▲  我们在“天舟一号”中研究抗衰老 | X实验室 Reward 长按二维码向我转账 受苹果公司新规定影响,微信 iOS 版的赞赏功能被关闭,可通过二维码转账支持公众号。 Scan QR Code via WeChat to follow Official Account

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存